新電子雜誌 » 熱門新聞 » 即時偵測細部動作　電腦理解人類肢體語言

即時偵測細部動作　電腦理解人類肢體語言

作者：詹益瑋

2017 年 07 月 12 日

語音辨識技術日新月異的同時，電腦似乎也開始理解人類的肢體語言。卡內基美隆大學(CMU)機器人學院的研究團隊近日發布其最新成果，可讓電腦在單一鏡頭內即時偵測複數人的姿勢、動作，以至臉部、五指等細節，藉此辨識人與人、人與物之間的互動關係，以期開創新一種人機互動模式。

機器人學院副教授Yaser Sheikh指出，人們透過肢體動作溝通的頻率與透過言語相去不遠，現今的電腦對此仍多少存有一些障礙。透過此新發布的辨識技術，人們能以更自然的方式與機器溝通，比方單純指向某物來對電腦下指令等；機器也能感測周遭人類彼此間的非言語溝通細節，諸如當下的動作、情緒，適不適合被打斷等，在餐廳、車道等社會空間中提供更進一步的服務。提供新的人機互動機制之外，Sheikh也期望令人們藉此更了解周遭的世界。

辨識群體中每個人的動作，乃至彼此間可能的互動情形，對電腦是不小的挑戰；尤其當群體較龐大時，純靠單體動作捕捉程式顯然不敷使用。另一方面，鑑於單一鏡頭難以捕捉手部動作全貌，加上相對身體、表情等動作缺乏已標註過的影像資料庫，手勢辨識顯得更為棘手。為此，該新技術的研發主要借助於CMU的Panoptic Studio多重攝影系統完成–此圓頂攝影棚具備超過500顆影像感測器，包含30個高畫質攝影機，可360度辨識棚內所有人的動作。

Sheikh表示，Panoptic Studio可同步強化肢體、臉部與手部的辨識訓練，模型由2D轉3D亦有助於自動建立家住過的影像資料。藉此，該研究團隊由上而下，先單獨定義影像場景中出現的各個身體部分，諸如手臂、腿部與臉部等，最終將所有部分接合起來為特定個體，以利電腦進行辨識；至於較棘手的手勢辨識，則透過該系統加速建立資料庫，令電腦單憑部分手部影像即可連結其他500多個相關角度，以此較精準地判斷鏡頭內個體的手部動作。

此辨識技術賦予機器理解人類行為的能力，應用上具有不少潛力，諸如協助自動駕駛車輛監控周遭行人的行為，藉此預測其動向、強化安全性；以運動賽事分析來說，則可判斷各球員的場上位置、當下的動作，進一步推斷其目前甚至未來的行動；未來甚至可望針對特定病徵協助進行診斷、復健等醫療相關作業，比方自閉症、憂鬱症、學習障礙等。

現階段為強化推廣，Sheikh表示，其研究團隊已釋出多人、手勢判別相關的程式碼於網路上。目前該技術已被廣泛採用於諸多研究群組，並有超過20個含汽車廠商在內的商業組織對此表示興趣。

標籤

近期研討會 More

2025-04-22 【實體活動】4月22日Edge AI 技術開發暨應用交流大會

白皮書

Cookie	Duration	Description
cookielawinfo-checkbox-analytics	11 months	This cookie is set by GDPR Cookie Consent plugin. The cookie is used to store the user consent for the cookies in the category "Analytics".
cookielawinfo-checkbox-functional	11 months	The cookie is set by GDPR cookie consent to record the user consent for the cookies in the category "Functional".
cookielawinfo-checkbox-necessary	11 months	This cookie is set by GDPR Cookie Consent plugin. The cookies is used to store the user consent for the cookies in the category "Necessary".
cookielawinfo-checkbox-others	11 months	This cookie is set by GDPR Cookie Consent plugin. The cookie is used to store the user consent for the cookies in the category "Other.
cookielawinfo-checkbox-performance	11 months	This cookie is set by GDPR Cookie Consent plugin. The cookie is used to store the user consent for the cookies in the category "Performance".
viewed_cookie_policy	11 months	The cookie is set by the GDPR Cookie Consent plugin and is used to store whether or not user has consented to the use of cookies. It does not store any personal data.

從自動化走向自主化 AI代理進軍製造現場

聯電新加坡廠擴建落成 強化全球多元生產基地布局

美超微AI產品線升級 支援最新款NVIDIA GPU

NVIDIA GTC大會開跑 雲端/邊緣AI新品同步發表

晶片功耗進入千瓦級世代 超流體散熱勢在必行

政府補貼引領電動巴士智慧化 產業永續發展還需完善配套

新技術/新應用層出不窮 顯示驅動IC機會眾多

大客車電氣化/智慧化同步推進 成運董事長吳定發：智慧綠色公共運輸趨勢不變

GAI賦能製程再進化 機器人自主運行前景可期

5G/WiFi無痕匯流 重塑企業無線網路

數位棋局新布局：韓國遊戲產業的AI突破與創新

從2D FET到2D CFET 製程微縮帶動2D材料需求(1)

從2D FET到2D CFET 製程微縮帶動2D材料需求(2)

低精度高性能：NVIDIA FP4格式如何加速AI應用新時代

特斯拉機器人的三重戰略：技術突破、供應鏈整合與市場開拓

SEMI：2025年全球晶圓廠設備投資可望達1100億美元

量子技術突破不斷 產業進入高速成長期

CounterPoint：2025年GenAI智慧手機普及率將超越三成

全球晶圓代工產業2024年第四季營收年增26%

固態電池加速商業化 歐美廠商預計2026年量產首代產品

貿澤電子供貨安森美Acuros CQD短波紅外線相機

安立知於OFC 2025展示全光網路通訊品質驗證技術

元太/友達合資成立電子紙模組生產線 預計2025年投產

Molex推出VersaBeam EBO光纖互連解決方案 提升資料中心部署效率

是德科技推出AI資料中心建構工具 提升AI訓練效能模擬能力

即時偵測細部動作 電腦理解人類肢體語言

手勢/心跳皆可偵測 140GHz MIMO雷達超有感

2017年營收亮眼 AMD續攻高運算/GPU市場

新一代Arm Project Trillium亮相 AI運算效能再攀升

英特爾重金收購Mobileye 自駕車布局更添勝算

WDC力拱RISC-V x86/ARM架構出現新對手

神經型態晶片成功辨識氣味 機器嗅覺取得重要突破

【經典秘笈下載】電源監控器處理延長電池壽命並提高性能

【工程師必備收藏】SiC引領能源新革命: 高效儲能與轉換系統設計指南

【免費下載】解鎖未來智慧車關鍵議題！免費下載《AI智慧車與智慧座艙》白皮書

【成功案例分享】即刻下載！ROHM使用Siemens Tanner提供一流的dual MOSFET元件

【熱門白皮書】快來下載！類比混合訊號驗證方法論

合聖總經理伍茂仁：矽光子需求大爆發 光通產業擴產潮到來

Silicon Labs亞太區暨日本業務副總裁王祿銘：2025物聯網/邊緣AI深度結合創新局

ams OSRAM Rest of Asia技術行銷總監李定翰：光與AI融合深化感測技術/應用

Qorvo資深產品行銷經理陳慶鴻：高整合/低電壓射頻前端再進化

以研發實力為根基 搭配國際策略合作 WAFERLOCK維夫拉克 插旗服務型機器人市場

數位棋局新布局：韓國遊戲產業的AI突破與創新

政府補貼引領電動巴士智慧化 產業永續發展還需完善配套

貿澤電子供貨安森美Acuros CQD短波紅外線相機

安立知於OFC 2025展示全光網路通訊品質驗證技術

元太/友達合資成立電子紙模組生產線 預計2025年投產

數位棋局新布局：韓國遊戲產業的AI突破與創新

政府補貼引領電動巴士智慧化 產業永續發展還需完善配套

新技術/新應用層出不窮 顯示驅動IC機會眾多

大客車電氣化/智慧化同步推進 成運董事長吳定發：智慧綠色公共運輸趨勢不變

從2D FET到2D CFET 製程微縮帶動2D材料需求(1)

從自動化走向自主化　AI代理進軍製造現場

聯電新加坡廠擴建落成　強化全球多元生產基地布局

美超微AI產品線升級　支援最新款NVIDIA GPU

NVIDIA GTC大會開跑　雲端/邊緣AI新品同步發表

晶片功耗進入千瓦級世代　超流體散熱勢在必行

政府補貼引領電動巴士智慧化　產業永續發展還需完善配套

新技術/新應用層出不窮　顯示驅動IC機會眾多

大客車電氣化/智慧化同步推進　成運董事長吳定發：智慧綠色公共運輸趨勢不變

GAI賦能製程再進化　機器人自主運行前景可期

5G/WiFi無痕匯流重塑企業無線網路

從2D FET到2D CFET　製程微縮帶動2D材料需求(1)

從2D FET到2D CFET　製程微縮帶動2D材料需求(2)

量子技術突破不斷　產業進入高速成長期

固態電池加速商業化　歐美廠商預計2026年量產首代產品

元太/友達合資成立電子紙模組生產線　預計2025年投產

Molex推出VersaBeam EBO光纖互連解決方案　提升資料中心部署效率

是德科技推出AI資料中心建構工具　提升AI訓練效能模擬能力

即時偵測細部動作　電腦理解人類肢體語言

手勢/心跳皆可偵測　140GHz MIMO雷達超有感

2017年營收亮眼　AMD續攻高運算/GPU市場

新一代Arm Project Trillium亮相　AI運算效能再攀升

英特爾重金收購Mobileye　自駕車布局更添勝算

WDC力拱RISC-V　x86/ARM架構出現新對手

神經型態晶片成功辨識氣味　機器嗅覺取得重要突破

合聖總經理伍茂仁：矽光子需求大爆發　光通產業擴產潮到來

以研發實力為根基　搭配國際策略合作　WAFERLOCK維夫拉克插旗服務型機器人市場

政府補貼引領電動巴士智慧化　產業永續發展還需完善配套

元太/友達合資成立電子紙模組生產線　預計2025年投產

政府補貼引領電動巴士智慧化　產業永續發展還需完善配套

新技術/新應用層出不窮　顯示驅動IC機會眾多

大客車電氣化/智慧化同步推進　成運董事長吳定發：智慧綠色公共運輸趨勢不變

從2D FET到2D CFET　製程微縮帶動2D材料需求(1)